Wissen gewinnen durch Wissen: Ontologiebasierte Informationsextraktion
نویسندگان
چکیده
Die Aufgabe der Informationsextraktion (IE) ist es, aus Texten einer Domäne gezielt die Informationen zu entnehmen, die gerade interessieren, und alle anderen zu überlesen (mehr z.B. bei Neumann 2004). Diese Aufgabe hat offensichtlich etwas mit der Fragebeantwortung (Question Answering) und mit dem themenoder fragespezifischen Zusammenfassen (Hintergrund dazu bei Afantenos et al. 2005, Endres-Niggemeyer 2004, Hovy 2003, Mani 2001, Mani & Maybury 1999) zu tun: das System soll nur die Textpassagen analysieren bzw. “verstehen”, die relevante Information beinhalten. Was relevant ist, bestimmt die aktuelle Benutzerfrage. Die klassische IE1 (Cunningham 2005) stützt sich bevorzugt auf Templates mit Attributen, die den Typ der gewünschten Informationen spezifizieren, also auf Datenstrukturen. Die Extraktionsergebnisse sind gefüllte Template-Instanzen. IE dieser Art wurden in den amerikanischen Message Understanding Conferences2 (MUC) ausgiebig evaluiert. Dabei wurden Inhalte vor allem über Named Entities gesucht und gefunden. Named Entity Recognition3 beruht auf der Verwendung der Namen von Personen, Orten, Firmen usw. Sie sind besonders leicht und sicher zu erkennen. Anstatt auf die Templates kann man sich auch zuerst auf die Inhalte, also auf die vorkommenden Wörter und Konzepte, konzentrieren und im Anschluss herausfinden, welche Strukturen (wie Relationen oder Templates) sie umgeben. Wenn nach Named Entities gesucht wird, ist man nur noch einen Denkschritt von einer ontologiegestützten Informationsextraktion entfernt, denn schließlich hat jedes Konzept einer Ontologie oder eines Thesaurus auch die wesentlichen Vorteile einer „Named Entity“. Ansätze zur ontologiebasierten IE Wissen gewinnen durch Wissen: Ontologiebasierte Informationsextraktion
منابع مشابه
Intelligente Agenten und KI
Neuere KI-Textbücher stützen sich zur Begriffsdefinition von ” Künstliche Intelligenz“ in der Regel massiv auf den Agentenbegriff. Autonomie, Körperhaftigkeit (embodiment), Reaktivität und Situiertheit in einem komplexen Kontext sind unmittelbar mit den Begriffen Agenten und KI verwoben. Hat man in der Vergangenheit eher versucht, einzelne Maschinen mit mächtigen Wissensverarbeitungsmechanismen...
متن کاملEinsatz eines Live Video Remote Systems in der Industrie
Arbeitsabläufe und Prozesse, sowie Maschinenanlagen gewinnen in der Industrie zunehmend an Komplexität und fordern von Serviceund Instandhaltungsmitarbeiter ein umfangreiches Wissen. Der Beitrag beschreibt das im Zuge der Produktentwicklung entstehende System, um Serviceund Instandhaltungsmitarbeiter unter Zuhilfenahme von „Wearables“ im speziellen Datenbrillen, bei komplexen Arbeitsabläufen du...
متن کاملMessbarkeit und Beeinflussung von Eventual-Consistency in Verteilten Datenspeichersystemen
Cloudspeicherdienste und NoSQL-Systeme, die sich zunehmend größerer Beliebtheit erfreuen, bieten meist weder transaktionale Features noch strikte Konsistenzgarantien. Stattdessen wird mit Eventual-Consistency lediglich garantiert, dass alle Schreiboperationen irgendwann – jedoch zu einem undefinierten Zeitpunkt – auf allen Replika ausgeführt werden. Die Unsicherheit, wann dies passiert, stellt ...
متن کاملKnowledge Management durch Prozess Mining mit FRED
Der Bedarf Wissen, welches sich überreichem Masse weitgehend auch elektronisch vorhanden ist, im Anlassfall verfügbar zu haben ist enorm. Knowledge Management ist daher als jene Disziplin welche sich die Lösung der vorgenannten Aufgabe zum Ziel gesteckt hat, mit einer hohen Erwartungshaltung und Interesse versehen. Die wirtschaftlichen Rahmenbedingungen wie Kostensenkung und Globalisierung gebe...
متن کاملK3 - Wissensmanagement über kooperative verteilte Formen der Produktion und der Aneignung von Wissen zur Bildung von konzeptueller Informationskompetenz durch Nutzung heterogener Informationsressourcen - Stand und Aussichten
Zusammenfassung K3 steht für Kooperation, Kommunikation und InformationsKompetenz und ist ein von der Konstanzer Informationswissenschaft initiiertes Projekt. K3 soll einen Beitrag zur Überwindung der gravierenden Informationskompetenzdefizite leisten, wie sie bei Studierenden durch die vom BMBF veranlasste Studie „Nutzung elektronischer wissenschaftlicher Informationen in der Hochschulausbildu...
متن کامل